Analisi bibliometrica - I docenti del DMIF

logo

Introduzione

Che cosa è la bibliometria?

La bibliometria è una disciplina che utilizza analisi quantitative e statistiche per analizzare le pubblicazioni scientifiche e le loro relazioni.

Il progetto si focalizza sull’analisi della produzione scientifica dei docenti del dipartimento DMIF dell’Università degli Studi di Udine, per cercare di dare una stima di:

  • come collaborano gli autori

  • quali sono i settori di maggiore interesse

  • gli autori più prolifici.

Per supporto all’analisi è stata utilizzata una libreria, Bibliometrix (Aria and Cuccurullo 2017), sviluppata da due docenti dell’Università di Napoli.

Fonte dei dati

I dati analizzati in questo progetto sono stati scaricati (ultimo download: 15/07/2024) da Scopus, uno dei principali dabatase bibliografici. E’ stata selezionata la sotto area “computer science” e successivamente sono stati selezionati 31 autori del DMIF, tra docenti e dottorandi.

Ogni articolo del dataframe contiene svariati attributi tra cui: la lista di autori, il titolo del documento, la sorgente di pubblicazione, il tipo di documento, le parole chiavi degli autori, le references, il numero di citazioni e l’anno di pubblicazione.

Analisi bibliometrica

Analisi descrittiva del dataframe

La tabella delle informazioni principali descrive le dimensioni della raccolta in termini di numero di documenti, numero di autori, numero di fonti, numero di parole chiave, durata e numero medio di citazioni.

  • “docs per autori” è calcolato come rapporto tra il numero totale di autori e il numero totale di articoli.

  • “co-autori per articolo” è calcolato come numero medio di co-autori per articolo.



MAIN INFORMATION ABOUT DATA

 Timespan                              1987 : 2024 
 Sources (Journals, Books, etc)        394 
 Documents                             1279 
 Annual Growth Rate %                  10.17 
 Document Average Age                  10.7 
 Average citations per doc             13.94 
 Average citations per year per doc    1.25 
 References                            29749 
 
DOCUMENT CONTENTS
 Keywords Plus (ID)                    6360 
 Author's Keywords (DE)                2017 
 
AUTHORS
 Authors                               1027 
 Author Appearances                    4349 
 Authors of single-authored docs       17 
 
AUTHORS COLLABORATION
 Single-authored docs                  77 
 Documents per Author                  1.25 
 Co-Authors per Doc                    3.4 
 International co-authorships %        32.53 
 

Annual Scientific Production

 Year    Articles
    1987        1
    1988        1
    1989        1
    1990        1
    1991        3
    1993        4
    1994        5
    1995       12
    1996        7
    1997       10
    1998       11
    1999        9
    2000       15
    2001       17
    2002       25
    2003       23
    2004       44
    2005       29
    2006       35
    2007       49
    2008       54
    2009       60
    2010       46
    2011       44
    2012       40
    2013       32
    2014       50
    2015       58
    2016       55
    2017       60
    2018       85
    2019       59
    2020       73
    2021       62
    2022       76
    2023       87
    2024       36

Annual Percentage Growth Rate 10.17 


Most Productive Authors

   Authors        Articles Authors        Articles Fractionalized
1    MONTANARI A       200  CHITTARO L                       78.6
2    CHITTARO L        164  MONTANARI A                      58.6
3    MIZZARO S         131  MIZZARO S                        41.1
4    DOVIER A          119  POLICRITI A                      40.3
5    POLICRITI A       111  DOVIER A                         40.0
6    MICULAN M          84  MICULAN M                        37.9
7    PIAZZA C           84  PIAZZA C                         27.4
8    FORESTI GL         59  LANCIA G                         26.1
9    PICIARELLI C       59  FRANCESCHET M                    22.3
10   FONTANA F          57  BRAJNIK G                        21.2


Top manuscripts per citations

                                        Paper                                    DOI  TC TCperYear   NTC
1  CORNIA M, 2018, IEEE TRANS IMAGE PROCESS            10.1109/TIP.2018.2851672      410     58.57 26.48
2  BUTTUSSI F, 2018, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2017.2653117     309     44.14 19.96
3  CHITTARO L, 2007, COMPUT EDUC                       10.1016/j.compedu.2005.06.002 297     16.50 12.03
4  CHITTARO L, 2015, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2015.2391853     265     26.50 15.88
5  NADALIN F, 2012, BMC BIOINFORM                      10.1186/1471-2105-13-S14-S8   250     19.23 13.66
6  CHITTARO L, 2006, COMPUTER                          10.1109/MC.2006.109           250     13.16  7.68
7  PICIARELLI C, 2006, PATTERN RECOGN LETT             10.1016/j.patrec.2006.02.004  222     11.68  6.82
8  JENSEN CS, 1998, LECT NOTES COMPUT SCI              10.1007/bfb0053710            220      8.15  4.51
9  FRANCESCHET M, 2010, J INF                          10.1016/j.joi.2010.06.003     185     12.33  6.44
10 FRANCESCHET M, 2010, SCIENTOMETRICS                 10.1007/s11192-009-0021-2     177     11.80  6.16


Corresponding Author's Countries

          Country Articles    Freq SCP MCP MCP_Ratio
1  ITALY               652 0.88227 518 134     0.206
2  SWITZERLAND          12 0.01624   0  12     1.000
3  UNITED KINGDOM       11 0.01488   0  11     1.000
4  USA                   9 0.01218   0   9     1.000
5  SPAIN                 8 0.01083   0   8     1.000
6  DENMARK               7 0.00947   0   7     1.000
7  FRANCE                6 0.00812   0   6     1.000
8  MEXICO                5 0.00677   0   5     1.000
9  NETHERLANDS           5 0.00677   0   5     1.000
10 FINLAND               3 0.00406   0   3     1.000


SCP: Single Country Publications

MCP: Multiple Country Publications


Total Citations per Country

     Country      Total Citations Average Article Citations
1  ITALY                    11155                     17.11
2  DENMARK                    227                     32.43
3  USA                        209                     23.22
4  UNITED KINGDOM             200                     18.18
5  SPAIN                      123                     15.38
6  FRANCE                      94                     15.67
7  MEXICO                      81                     16.20
8  NETHERLANDS                 69                     13.80
9  CYPRUS                      65                     32.50
10 SOUTH AFRICA                65                     65.00


Most Relevant Sources

                                                                                                                         Sources       
1  LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS)
2  CEUR WORKSHOP PROCEEDINGS                                                                                                           
3  THEORETICAL COMPUTER SCIENCE                                                                                                        
4  LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS LIPICS                                                                             
5  ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES                                                                                      
6  ELECTRONIC PROCEEDINGS IN THEORETICAL COMPUTER SCIENCE EPTCS                                                                        
7  ELECTRONIC NOTES IN THEORETICAL COMPUTER SCIENCE                                                                                    
8  EURO ADVANCED TUTORIALS ON OPERATIONAL RESEARCH                                                                                     
9  INFORMATION AND COMPUTATION                                                                                                         
10 INTERNATIONAL JOURNAL OF HUMAN COMPUTER STUDIES                                                                                     
   Articles
1       249
2       118
3        33
4        29
5        26
6        25
7        24
8        16
9        15
10       15


Most Relevant Keywords

   Author Keywords (DE)      Articles         Keywords-Plus (ID)     Articles
1    EVALUATION                    31 COMPUTER CIRCUITS                   125
2    MODEL CHECKING                26 SEMANTICS                           103
3    VIRTUAL REALITY               25 TEMPORAL LOGIC                      100
4    MOBILE DEVICES                24 LOGIC PROGRAMMING                    97
5    INTERVAL TEMPORAL LOGIC       22 ARTIFICIAL INTELLIGENCE              92
6    DEEP LEARNING                 21 INFORMATION RETRIEVAL                72
7    CROWDSOURCING                 19 AUTOMATA THEORY                      68
8    COMPLEXITY                    18 INTERVAL TEMPORAL LOGIC              68
9    MACHINE LEARNING              16 ALGORITHMS                           64
10   BISIMULATION                  15 COMPUTABILITY AND DECIDABILITY       61

Autore più produttivo: Prof. Montanari con 200 articoli.

Paese più produttivo: Italia.

Anno più produttivo: 2023 con 87 pubblicazioni.

Anno con media citazioni in articoli più alta: 2018.

Anno con più citazioni: 1987.

Documenti per tipo

                 DT   n
1  CONFERENCE PAPER 713
2           ARTICLE 462
3      BOOK CHAPTER  42
4         EDITORIAL  40
5            REVIEW  16
6           ERRATUM   2
7              BOOK   1
8        DATA PAPER   1
9              NOTE   1
10     SHORT SURVEY   1

Tipo di pubblicazione più presente: conference paper, seguito da articoli e capitoli di libro.

Analisi dei riferimenti citati

E’ possibile analizzare la frequenza dei riferimenti/primi autori più citati nel dataset in analisi.

Papers citati più frequentemente:

                                                                                                                                                                                                                         [,1]
MOSZKOWSKI B., REASONING ABOUT DIGITAL CIRCUITS, (1983)                                                                                                                                                                    36
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUNICATIONS OF THE ACM, 26, 11, PP. 832-843, (1983)                                                                                                         32
BRESOLIN D., GORANKO V., MONTANARI A., SCIAVICCO G., PROPOSITIONAL INTERVAL NEIGHBORHOOD LOGICS: EXPRESSIVENESS, DECIDABILITY, AND UNDECIDABLE EXTENSIONS, ANNALS OF PURE AND APPLIED LOGIC, 161, 3, PP. 289-304, (2009)   25
VENEMA Y., A MODAL LOGIC FOR CHOPPING INTERVALS, JOURNAL OF LOGIC AND COMPUTATION, 1, 4, PP. 453-476, (1991)                                                                                                               25
HALPERN J., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991)                                                                                                       23
VENEMA Y., EXPRESSIVENESS AND COMPLETENESS OF AN INTERVAL TENSE LOGIC, NOTRE DAME JOURNAL OF FORMAL LOGIC, 31, 4, PP. 529-547, (1990)                                                                                      23
HALPERN J.Y., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991)                                                                                                     21
HILLSTON J., A COMPOSITIONAL APPROACH TO PERFORMANCE MODELLING, (1996)                                                                                                                                                     19
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUN. ACM, 26, 11, PP. 832-843, (1983)                                                                                                                       17
BRESOLIN D., MONTANARI A., SCIAVICCO G., AN OPTIMAL DECISION PROCEDURE FOR RIGHT PROPOSITIONAL NEIGHBORHOOD LOGIC, JOURNAL OF AUTOMATED REASONING, 38, 1-3, PP. 173-199, (2007)                                            16

Si noti che 2 articoli del Professor Montanari sono tra i più citati.

Primi autori citati più frequentemente:

            [,1]
MONTANARI A 1120
ET AL       1063
SCIAVICCO G  449
DOVIER A     409
MIZZARO S    407
POLICRITI A  381
SALA P       380
CHITTARO L   365
PONTELLI E   348
BRESOLIN D   345
GORANKO V    292
MICULAN M    285
PIAZZA C     271
PERON A      242
FORMISANO A  199

E’ possibile notare che gli autori più frequentemente citati sono i Professori Montanari, Dovier, Mizzaro e Policriti.

H-index degli autori

L’h-index è una metrica a livello di autore che cerca di misurare sia la produttività che l’impatto citazionale delle pubblicazioni.

L’indice si basa sull’insieme degli articoli più citati dello scienziato e sul numero di citazioni ricevute in altre pubblicazioni. L’indice è strutturato per quantificare mediante un singolo indice numerico non solo la produzione, ma anche l’influenza di uno scienziato, distinguendolo da chi ha pubblicato molti articoli ma di scarso interesse.

Quindi, uno scienziato ha un indice n se almeno n lavori tra quelli che ha pubblicato sono stati citati almeno n volte ciascuno.

L’i10-index consiste nel numero di pubblicazioni di uno stesso autore con almeno 10 citazioni.

H-index dei primi 10 autori più produttivi (in questa raccolta):

        Element h_index i10_index   TC  NP PY_start
1    CHITTARO L      39        93 4886 164     1991
2   MONTANARI A      23        63 2144 200     1993
3     MIZZARO S      20        40 1453 131     1997
4   POLICRITI A      19        43 1608 111     1990
5      DOVIER A      18        38 1212 119     1998
6  PICIARELLI C      17        25  961  59     2005
7     MICULAN M      16        26  709  84     1994
8      PIAZZA C      16        23  894  84     2000
9    FORESTI GL      15        23  874  59     2005
10    FONTANA F       9         8  262  57     2010

Gli autori con l’H-index più alto sono i Prof. Chittaro (39), Prof. Montanari (23) e Prof. Mizzaro (20).

Matrici di rete bibliografica

Gli attributi dei paper sono collegati tra loro attraverso il paper stesso: autore/i alla rivista, parole chiave alla data di pubblicazione, ecc. Alcune delle analisi descrittive viste in precedenza si possono visualizzare attraverso reti bipartite.

Reti bipartite

Queste connessioni di diversi attributi generano reti bipartite che possono essere rappresentate come matrici rettangolari (Papers x Attributi).

Rete Paper x Fonte di pubblicazione:

L’oggetto è una matrice binaria rettangolare che rappresenta una rete bipartita in cui le righe e le colonne sono, in questo caso, rispettivamente papers e fonti.

L’elemento generico \(bip_{ij}\) è 1 se il paper \(i\) è stato pubblicato nella fonte \(j\), 0 altrimenti.

La somma della colonna \(j\)-esima \(bip_j\) rappresenta il numero di papers pubblicati nella fonte \(j\).

Fonti di pubblicazione più rilevanti:

LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS) 
                                                                                                                                 249 
                                                                                                           CEUR WORKSHOP PROCEEDINGS 
                                                                                                                                 118 
                                                                                                        THEORETICAL COMPUTER SCIENCE 
                                                                                                                                  33 
                                                                            LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS, LIPICS 
                                                                                                                                  29 
                                                                                      ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES 
                                                                                                                                  26 

Rete degli autori: Paper x Autore, conta quanti articoli fatti da autori.

MONTANARI A  CHITTARO L   MIZZARO S    DOVIER A POLICRITI A 
        200         164         131         119         111 

Accoppiamento bibliografico - autori

Le pubblicazioni scientifiche contengono riferimenti ad altri lavori scientifici. Questo genera un’altra rete, quella delle reti di accoppiamento o co-citazioni.

Due autori sono accoppiati bibliograficamente se almeno una fonte citata compare nelle loro pubblicazioni.

Rete di accoppiamento: \[B = A\cdot A^T\] dove A è una rete bipartita (Papers x Citazioni). Due autori sono collegati da un arco nella rete se citano insieme uno o più documenti.

L’elemento \(b_{i,j}\) indica quanti accoppiamenti bibliografici esistono tra \(i\) e \(j\). La forza dell’accoppiamento di due autori, \(i\) e \(j\), è definita dal numero di riferimenti che gli autori hanno in comune.

L’accoppiamento bibliografico tra autori è una misura di quanto due autori condividono riferimenti comuni nelle loro pubblicazioni. In altre parole, quanti autori citano gli stessi lavori nelle loro ricerche.

(Per comodità nella computazione e visualizzazione, vengono utilizzati soltanto i 40 nodi con il grado più alto).

Analisi della rete

I nodi più centrale della rete risultano essere il Professor Chittaro ed il Professor Montanari. Il primo ha i valori più alti nella centralità di betweenness e pagerank, mentre il secondo nella centralità di grado, di autovettore e closeness. 1.

# A tibble: 40 × 5
   name        degree closeness betweenness   eigen
   <chr>        <dbl>     <dbl>       <dbl>   <dbl>
 1 MONTANARI A   43.1  0.000605    0.108    1      
 2 SALA P        19.4  0.000493    0.000242 0.713  
 3 SCIAVICCO G   17.0  0.000569    0.00808  0.554  
 4 PERON A       16.1  0.000501    0.000389 0.621  
 5 DOVIER A      13.6  0.000607    0.0852   0.00871
 6 BOZZELLI L    13.6  0.000498    0.000237 0.541  
 7 MIZZARO S     13.4  0.000598    0.108    0.00252
 8 MOLINARI A    12.3  0.000500    0.000229 0.490  
 9 PIAZZA C      11.6  0.000565    0.0577   0.0176 
10 ROITERO K     10.4  0.000565    0.0329   0.00252
# ℹ 30 more rows
         vertex cluster degree_centrality btw_centrality clos_centrality eigen_centrality pagerank_centrality
1   montanari a       1        0.82051282      50.666236      0.02173913       1.00000000         0.044729316
2    chittaro l       1        0.74358974     102.696307      0.02040816       0.86744491         0.045364768
4      dovier a       1        0.74358974      43.715810      0.02040816       0.92614594         0.040594149
5   policriti a       1        0.66666667      22.329556      0.01886792       0.87974408         0.036461371
6     miculan m       1        0.46153846      11.252372      0.01639344       0.59638520         0.026895646
7      piazza c       1        0.66666667      16.312693      0.01923077       0.90679169         0.036044751
8    foresti gl       1        0.30769231      11.576923      0.01515152       0.33841027         0.020934465
9  piciarelli c       1        0.23076923       1.305995      0.01449275       0.27945626         0.015457702
10    fontana f       1        0.05128205       0.000000      0.01204819       0.06086337         0.006562515
11  formisano a       1        0.48717949      14.447147      0.01694915       0.67177740         0.027537898

Numero di nodi:

[1] 1027

Densità:

[1] 0.9491095

indica una rete densa, altamente collegata.

Transitività:

[1] 0.3441892

rete poco clusterizzata.

Lunghezza media dei percorsi e diametro:

[1] 2.892956
[1] 5

molto breve, rete compatta e ben collegata.

Utilizzando la libreria poweRlaw, è possibile controllare se la mia distribuzione dei gradi segue una distribuzione power-law.

I pallini indicano la mia distribuzione dei gradi mentre la linea rossa indica la power-law adattata ai miei dati.

Il p-value di 0.33 indica che i miei dati sono compatibili con la distribuzione power-law, con pochi nodi altamente connessi (hub) e molti nodi con poche connessioni.

Collaborazione autori

La rete di collaborazione scientifica è una rete in cui i nodi sono gli autori e i legami sono le coautorialità in articoli, in quanto quest’ultima è una delle forme più documentate di collaborazione scientifica (Glanzel, 2004).

Due autori sono collegati nella rete se hanno collaborato insieme in un articolo.

Una rete di collaborazione tra autori può essere ottenuta utilizzando la formulazione generale: \[AC=A^T \cdot A\] dove A è una rete bipartita Papers x Autori.

L’elemento diagonale \(ac_i\) è il numero di papers di cui il ricercatore \(i\) è autore o coautore.

(Per comodità nella computazione e visualizzazione, vengono utilizzati soltanto i 30 nodi con il grado più alto).

Analisi della rete

Sono presenti 4 clusters ed in ognuno di essi è presente almeno un nodo con dei valori alti di centralità, il che indica un ruolo di connessione e influenza all’interno del cluster.

  • cluster 1: Prof. Chittaro e Prof. Serra

  • cluster 2: Prof. Policriti e Prof. Dovier

  • cluster 3: Prof. Montanari

  • cluster 4: Prof. Mizzaro e Prof. Della Mea

         vertex cluster degree_centrality btw_centrality clos_centrality eigen_centrality pagerank_centrality
2    chittaro l       1        0.20689655    104.0937022      0.01724138        0.5445844          0.04010246
6     miculan m       1        0.13793103     27.7710751      0.01449275        0.3070842          0.02774521
8    foresti gl       1        0.27586207     40.7595238      0.01538462        0.5868884          0.05193366
9  piciarelli c       1        0.13793103      2.5277778      0.01234568        0.3254915          0.02740807
10    fontana f       1        0.06896552      2.0000000      0.01098901        0.1204134          0.01837675
17  scagnetto i       1        0.17241379     33.0877675      0.01470588        0.4221897          0.03271515
18      serra g       1        0.27586207     81.8256989      0.01587302        0.6961796          0.04862541
19    brajnik g       1        0.13793103      5.7349335      0.01408451        0.4288622          0.02630014
21      ranon r       1        0.06896552      5.6619048      0.01190476        0.1142127          0.01849130
27  micheloni c       1        0.13793103      1.4761905      0.01234568        0.3825232          0.02680649
29      tasso c       1        0.24137931     20.1095367      0.01515152        0.6186625          0.04362959
4      dovier a       2        0.17241379     12.9590804      0.01298701        0.5048830          0.03419016
5   policriti a       2        0.31034483     63.0502603      0.01408451        0.7569098          0.06050805
7      piazza c       2        0.17241379      6.4073260      0.01298701        0.5461876          0.03356030
11  formisano a       2        0.10344828      0.0000000      0.01030928        0.2782507          0.02261280
12     lancia g       2        0.03448276      0.0000000      0.01010101        0.1299985          0.01071465
13   pontelli e       2        0.13793103      0.3333333      0.01041667        0.3583081          0.02863919
1   montanari a       3        0.37931034    149.7373916      0.01785714        1.0000000          0.06829667
15       sala p       3        0.20689655      7.6666667      0.01369863        0.5887141          0.03925775
16  sciavicco g       3        0.17241379     65.6352227      0.01587302        0.5545742          0.03266792
20      peron a       3        0.17241379      3.9833333      0.01298701        0.5600494          0.03335311
22    gigante n       3        0.17241379     11.9320095      0.01449275        0.5759793          0.03294865
23   bresolin d       3        0.10344828      0.0000000      0.01315789        0.3681076          0.02139253
24   bozzelli l       3        0.10344828      0.0000000      0.01219512        0.3690480          0.02150901
25     geatti l       3        0.13793103     29.4044085      0.01470588        0.4534128          0.02748925
3     mizzaro s       4        0.27586207     26.0528726      0.01315789        0.6376023          0.04851419
14    roitero k       4        0.17241379      5.2903123      0.01190476        0.4221791          0.03181247
26  della mea v       4        0.17241379      6.2093599      0.01176471        0.3820190          0.03215018
28  demartini g       4        0.17241379      5.2903123      0.01190476        0.4221791          0.03181247
30  maddalena e       4        0.13793103      0.0000000      0.00990099        0.3201366          0.02643640

Numero di nodi:

[1] 1027

Densità:

[1] 0.02355658

indica una rete molto sparsa, poco collegata.

Transitività:

[1] 0.5462783

rete moderatamente clusterizzata.

Lunghezza media dei percorsi e diametro:

[1] 3.764174
[1] 7

breve, rete compatta e collegata.

Utilizzando la libreria poweRlaw, è possibile controllare se la mia distribuzione dei gradi segue una distribuzione power-law.

I pallini indicano la mia distribuzione dei gradi mentre la linea rossa indica la power-law adattata ai miei dati.

Il p-value di 0.17 indica che i miei dati sono compatibili con la distribuzione power-law, con pochi nodi altamente connessi (hub) e molti nodi con poche connessioni.

Power measure

          Author PowerPercentage
6      MICULAN M       13.824084
5    POLICRITI A        9.242846
4       DOVIER A        6.816099
2     CHITTARO L        6.669387
1    MONTANARI A        6.471173
3      MIZZARO S        5.859651
19     BRAJNIK G        3.817711
60  PERESSOTTI M        3.615529
7       PIAZZA C        3.580627
12      LANCIA G        2.596333
22 FRANCESCHET M        2.564615
27      MIROLO C        2.314060
21       RANON R        2.263985
58  D'AGOSTINO G        1.965212
70   ROMANELLO R        1.789940

Analizzando la misura di potenza, la quale afferma che un nodo è potente se è connesso a nodi non potenti, si ricava che i nodi più potenti all’interno della rete delle collaborazioni sono il Prof. Miculan (13.8% del potere totale) e il Prof. Policriti (9.2% del potere totale).

Analisi parole chiave

Rete parole chiave

Rete Bipartita Papers x Keyword Scopus

Ogni paper ha associate delle parole chiave dal database di Scopus.

Word cloud

Dai dati della rete bipartita è possibile creare un dataframe con le frequenze delle parole, da cui si può ricavare una word cloud.

Le tre parole più presenti sono Computer Circuits (125), Semantics (101) e Temporal Logic (99).

Rete co-occorrenze parole chiave

(Per comodità nella computazione e visualizzazione, vengono utilizzati soltanto i 45 nodi con il grado più alto).

Ci sono 4 cluster di parole chiave:

  • nel primo, il nodo più centrale secondo le metriche di betweenness e closeness è “Mobile Devices”; mentre “Algorithms” risulta il nodo con centralità di autovettore e PageRank più alto;

  • nel secondo, “Computer Programming” è il nodo con betweenness e clonesess più alta, mentre “Computer Circuits” ha centralità di autovettore e PageRank più alto.

  • nel terzo,

  • nel quarto,

                           vertex cluster degree_centrality btw_centrality clos_centrality eigen_centrality
6           information retrieval       1         0.5454545     22.4801313     0.011904762      0.056459227
10                virtual reality       1         0.5227273     21.0523077     0.012195122      0.029511782
15                  deep learning       1         0.3409091     11.7002640     0.010526316      0.019723813
19                 mobile devices       1         0.5454545     79.5681415     0.014084507      0.031009269
24                user interfaces       1         0.4545455     29.0554626     0.012987013      0.032310035
27     human computer interaction       1         0.3181818     11.6507394     0.011904762      0.021454576
29                       websites       1         0.3409091     14.7633647     0.011494253      0.009151213
34                 search engines       1         0.3181818     16.6108246     0.011235955      0.019853430
37                quality control       1         0.4772727     51.1283408     0.013698630      0.024915514
1               computer circuits       2         0.5227273      2.5186584     0.010416667      1.000000000
2                       semantics       2         0.7954545      2.2218083     0.010752688      0.565096241
3                  temporal logic       2         0.5454545      7.8602517     0.011363636      0.877233399
4               logic programming       2         0.6136364     13.2212397     0.010869565      0.552949082
5         artificial intelligence       2         0.8863636     17.0831213     0.011764706      0.396922933
7                 automata theory       2         0.6363636      5.9621451     0.010638298      0.399563225
9  computability and decidability       2         0.5000000      5.4817719     0.011111111      0.462710161
11                 model checking       2         0.5909091      6.5987640     0.011764706      0.602612719
12               computer science       2         0.6590909      9.7839744     0.011363636      0.217081769
13                   formal logic       2         0.5681818      0.4333333     0.009345794      0.404909334
14             computation theory       2         0.5681818     28.1866335     0.011904762      0.423228782
16 computer programming languages       2         0.6363636     16.1572287     0.012345679      0.339627848
17                problem solving       2         0.6136364     14.2647093     0.012048193      0.218931953
18                     set theory       2         0.5454545      3.9449987     0.010752688      0.288069428
20            mathematical models       2         0.6136364     12.2622062     0.012345679      0.198403331
22                        algebra       2         0.5227273      2.7353859     0.010309278      0.215624662
23                   calculations       2         0.5000000     26.6158352     0.012195122      0.184360000
25       computational complexity       2         0.5681818      5.7745171     0.010638298      0.262873514
26              constraint theory       2         0.5681818      9.3433316     0.011764706      0.185752623
30           computer programming       2         0.5454545     35.0611154     0.012500000      0.161229398
32               database systems       2         0.5909091     62.4346465     0.012820513      0.096033108
38      computational linguistics       2         0.5681818     45.5723873     0.013333333      0.104261224
8                      algorithms       3         0.8181818     22.0393695     0.012658228      0.209667485
21            computer simulation       3         0.7272727     50.9129478     0.013333333      0.116559391
31               learning systems       3         0.4545455     19.8959031     0.012195122      0.072854883
33                 bioinformatics       3         0.5227273     51.0686281     0.012820513      0.089910678
39                    data mining       3         0.5227273     28.1633496     0.012658228      0.062498328
43             information theory       3         0.5454545     39.8495789     0.013157895      0.070391481
28                          human       4         0.4318182      3.7055486     0.011235955      0.030753496
35                         humans       4         0.3863636      4.1569014     0.011235955      0.026110694
36                        article       4         0.4090909      6.1375934     0.010989011      0.027216659
40              computer graphics       4         0.3636364      9.4157471     0.011111111      0.012027154
41                 image analysis       4         0.3181818     15.1095939     0.011627907      0.015432547
42                         female       4         0.2727273      5.6840909     0.010752688      0.007402049
44                      diagnosis       4         0.3181818     13.8847762     0.011904762      0.013934399
45               priority journal       4         0.3409091      6.3179176     0.011627907      0.019834678
   pagerank_centrality
6          0.022751385
10         0.017007700
15         0.011289926
19         0.019337653
24         0.016139454
27         0.016030811
29         0.012847247
34         0.013093741
37         0.010787434
1          0.054552145
2          0.045843705
3          0.043750705
4          0.037799786
5          0.035718099
7          0.029470671
9          0.027221367
11         0.030437252
12         0.022560411
13         0.029013690
14         0.025714782
16         0.024566142
17         0.026106806
18         0.022484240
20         0.023469211
22         0.020600603
23         0.016284159
25         0.022766949
26         0.021232125
30         0.018391213
32         0.014487293
38         0.012641814
8          0.034481620
21         0.021828512
31         0.014249688
33         0.012552149
39         0.013163492
43         0.012161876
28         0.030971072
35         0.026320896
36         0.023894536
40         0.014293203
41         0.008986545
42         0.015067567
44         0.012430595
45         0.015199730

Numero di nodi:

[1] 6360

Densità:

[1] 0.005569563

indica una rete molto sparsa, poco collegata.

Transitività:

[1] 0.2283555

rete poco clusterizzata.

Lunghezza media dei percorsi e diametro:

[1] 2.967987
[1] 5

molto breve, rete compatta e ben collegata.

Utilizzando la libreria poweRlaw, è possibile controllare se la mia distribuzione dei gradi segue una distribuzione power-law.

I pallini indicano la mia distribuzione dei gradi mentre la linea rossa indica la power-law adattata ai miei dati.

Il p-value di 0.43 indica che i miei dati sono compatibili con la distribuzione power-law, con pochi nodi altamente connessi (hub) e molti nodi con poche connessioni.

Mappa tematica

L’analisi di co-occorrenza delle parole chiave genera cluster tematici, la cui densità e centralità permettono di classificarli e mapparli in un diagramma bidimensionale, creando una mappa tematica.

Essa consente di analizzare i temi in base al quadrante in cui sono collocati:

  1. quadrante in alto a sinistra: temi molto specializzati/di nicchia (cluster molto denso e poco centrale);

  2. quadrante in alto a destra: temi motori (cluster molto denso e molto centrale);

  3. quadrante in basso a sinistra: temi emergenti o in via di estinzione (cluster poco denso e poco centrale);

  4. quadrante in basso a destra: temi di base (cluster poco denso ma molto centrale).

Ad esempio, il cluster in cui spicca la parola “algorithms” è nel quadrante dei temi di base, mentre “crowdsourcing” si trova nel quadrante dei temi emergenti o in declino. Il cluster con “finite element method” si trova nel quadrante dei temi di nicchia.

La colonna n.rel si riferisce alle frequenze relative delle parole all’interno del cluster di appartenenza.

# A tibble: 45 × 4
# Groups:   Cluster [9]
   Cluster Words                   Occurrences  n.rel
     <dbl> <chr>                         <dbl>  <dbl>
 1       1 algorithms                       63 0.0696
 2       1 deep learning                    37 0.0409
 3       1 computer simulation              37 0.0409
 4       1 learning systems                 31 0.0343
 5       1 database systems                 30 0.0331
 6       2 semantics                       101 0.0474
 7       2 logic programming                92 0.0432
 8       2 artificial intelligence          88 0.0413
 9       2 automata theory                  67 0.0315
10       2 computer science                 55 0.0258
# ℹ 35 more rows

Conclusione FINIRE

L’analisi della produzione scientifica ha evidenziato diversi aspetti importanti, soprattutto attraverso l’analisi delle varie reti.

La rete dell’accoppiamento bibliografico tra autori ha mostrato come gli autori del dipartimento siano collegati tra loro attraverso le citazioni comuni, indicando una forte interconnessione tematica e la presenza di aree di ricerca ben definite e collaborazioni frequenti.

La rete di collaborazione tra autori ha rivelato la presenza di diversi cluster di collaborazione, con alcuni autori chiave che fungono da nodi centrali.

La rete delle co-occorrenze delle parole chiave ha messo in luce le principali aree di ricerca del dipartimento e le connessioni tematiche tra di esse. Alcune parole chiave emergono come particolarmente centrali e frequenti, riflettendo le aree di maggiore interesse e attività all’interno del dipartimento.

Inoltre, tutte le reti analizzate hanno la proprietà di piccolo mondo, con dei valori bassi di diametro e lunghezza media dei cammini e le tre distribuzioni di grado analizzate seguono una distribuzione dei gradi power-law.

In sintesi, si può dire che all’interno del dipartimento operano gruppi di ricerca che si distinguono per una notevole produttività scientifica, la quale si traduce in un significativo apporto alla letteratura di settore. Pur focalizzandosi su ambiti di ricerca differenti, i gruppi collaborano attivamente tra loro, favorendo lo scambio di conoscenze e competenze.

Aria, Massimo, and Corrado Cuccurullo. 2017. “Bibliometrix: An r-Tool for Comprehensive Science Mapping Analysis.” Journal of Informetrics 11 (4): 959–75. https://doi.org/10.1016/j.joi.2017.08.007.

  1. Tutte le nozioni viste a lezione sono utilizzate ma non ri-definite.↩︎